Harness Engineering (。・ω・。)ノ
驾 驭 工 程 ✧
围绕 AI 智能体设计和构建 约束机制反馈回路工作流控制持续改进循环系统工程实践 (`・ω・´)
Harness
Engineering
约束机制
反馈回路
工作流控制
持续改进
四大支柱 · 上
约束机制 (。ŏ_ŏ)
给 AI 划定执行边界
能做什么 — 安全区域 不能做什么 — 禁止区 🔒
限定工具调用范围
规则化执行标准
反馈回路 (`・ω・´)
实时校验,自主纠错
Step 1 执行 Step 2 校验 🔍 OK? 🤔 发现错误 需要修正 ⚠️ 🔄 修正
自动运行测试验证
错误自主回溯修正
四大支柱 · 下
工作流控制 (。・ω・。)ノ
按流程一步步执行
Step 1 📋 Step 2 🔧 Step 3 🧪 ❌ 不跳步 ❌ 不摆烂 ❌ 不提前宣布完成
严格顺序执行
每步验证后继续
持续改进循环 ✧(≖ ◡ ≖✿)
犯错沉淀,越用越稳
😵 犯错 🔍 分析 📝 沉淀 优化 不再犯 📈 越来越好
错误经验持久化存储
每次迭代更智能
论文 · Building Effective AI Coding Agents
Agent 运行架构 三层 (。・ω・。)
1
Scaffolding 脚手架
系统指令编译 · 工具规范定义 · 执行前准备
系统指令 工具定义 环境配置
2
Harness 运行时编排 · 核心
推理循环 · 工具调用 · 上下文管理 · 安全管控 · 持久化
推理循环 安全管控 持久化
3
Context Engineering 上下文工程
Token 资源分配 · 信息保留与舍弃
Token管理 信息筛选
预编译阶段
Agent 启动前的所有准备
运行时核心 ⭐
Agent 执行的"大脑"
智能记忆管理
有限窗口,无限智慧
一个公式总结 (`・ω・´)ゞ
Coding Agent 能稳定干活的智能体
=
AI Model(s) 一个或多个大模型
+
Harness 完善的驾驭系统
一个能稳定干活的 AI 代码智能体 ✧*。٩(ˊᗜˋ*)و✧*。
= 大模型 + 完善的 Harness 系统 (。・ω・。)ノ
约束机制
反馈回路
工作流控制
持续改进